深入理解 happens-before 原则

Original 陈树义树哥聊编程 2022-10-28

收录于合集

在前面的文章中（从 CPU 说起，深入理解 Java 内存模型！），我们深入了解了 Java 内存模型，知道了 Java 内存模型诞生的意义，以及其要解决的问题。最终我们知道：Java 内存模型就是定义了 8 个基本操作以及 8 个规则，只要遵守这些规则的并发操作，那么它们就是安全的。

即使强如树哥的人，看了这 16 条规则也很头疼。它们太过于繁琐了，非常不利于我们日常代码的编写。为了能帮助编程人员理解，于是就有了与其相等价的判断原则 —— 先行发生原则，它可以用于判断一个访问在并发环境下是否安全。

到这里，我们需要明白：happens-before 原则是对 Java 内存模型的简化，让我们更好地写出并发代码。就像 Java 语言等高级语言，之于汇编语言、机器语言等低级语言一样，可以让编程人员免受「皮肉之苦」。

今天就让我们来深入聊聊关于 happens-before 的那些事儿！

什么是 happens-before？

happens-before 指的是 Java 内存模型中两项操作的顺序关系。例如说操作 A 先于操作 B，也就是说操作 A 发生在操作 B 之前，操作 A 产生的影响能够被操作 B 观察到。这里的「影响」包括：内存中共享变量的值、发送了消息、调用了方法等。

举个很简单的例子：下面代码里 i=1 在线程 A 中执行，而 j=i 在线程 B 中执行。因为 i=1 操作先于 j=i 执行，那么 i=1 操作的结果就应该能够被线程 B 观察到。

// 在线程 A 中执行
i = 1;
// 在线程 B 中执行
j = i;

Java 内存模型下一共有 8 条 happens-before 规则，如果线程间的操作无法从如下几个规则推导出来，那么它们的操作就没有顺序性保障，虚拟机或者操作系统就能随意地进行重排序，从而可能会发生并发安全问题。

程序次序规则（Program Order Rule）：在一个线程内，按照程序代码顺序，书写在前面的操作先行发生于书写在后面的操作。准确地说，应该是控制流顺序而不是程序代码顺序，因为要考虑分支、循环等结构。
管程锁定规则（Monitor Lock Rule）：一个 unlock 操作先行发生于后面对同一个锁的 lock 操作。这里必须强调的是同一个锁，而 “后面” 是指时间上的先后顺序。
volatile 变量规则（Volatile Variable Rule）：对一个 volatile 变量的写操作先行发生于后面对这个变量的读操作，这里的 “后面” 同样是指时间上的先后顺序。
线程启动规则（Thread Start Rule）：Thread 对象的 start () 方法先行发生于此线程的每一个动作。
线程终止规则（Thread Termination Rule）：线程中的所有操作都先行发生于对此线程的终止检测，我们可以通过 Thread.join () 方法结束、Thread.isAlive () 的返回值等手段检测到线程已经终止执行。
线程中断规则（Thread Interruption Rule）：对线程 interrupt () 方法的调用先行发生于被中断线程的代码检测到中断事件的发生，可以通过 Thread.interrupted () 方法检测到是否有中断发生。
对象终结规则（Finalizer Rule）：一个对象的初始化完成（构造函数执行结束）先行发生于它的 finalize () 方法的开始。
传递性（Transitivity）：如果操作 A 先行发生于操作 B，操作 B 先行发生于操作 C，那就可以得出操作 A 先行发生于操作 C 的结论。

极简实践案例

Java 语言无须任何同步手段保障，就能成立的先行发生规则，就只有上面这些了。下面举个例子来说明如何用这些规则去判断操作是否具备顺序性，是否是线程安全的。

private int value = 0;

public void setValue(int value){
    this.value = value;
}

public int getValue(){
    return value;
}

上面的代码是一组很普通的 getter/setter 方法。假设线程 A 和 B，线程 A 先（时间上的先后）调用了 setValue(1)，之后线程 B 调用了同一个对象的 getValue()，那么线程 B 收到的返回值是什么？

我们依次分析一下先行发生原则中的各项规则：

首先，由于两个方法分别由线程 A 和线程 B 调用，不在一个线程中，所以程序次序规则在这里不适用。
接着，由于没有同步块，自然就不会发生 lock 和 unlock 操作，所以管程锁定规则不适用。
继续，由于 value 变量没有被 volatile 关键字修饰，所以 volatile 变量规则不适用。
继续，后面的线程启动、终止、中断规则和对象终结规则也和这里完全没有关系。
最后，因为没有一个适用的先行发生规则，所以最后一条传递性也无从谈起。

因此，即使我们知道线程 A 在操作时间上先于线程 B，但我们还是无法确定线程 B getValue() 方法的返回结果。换句话说，这里面的操作不是线程安全的。

那怎么修复这个问题呢？

我们至少有两种比较简单的方案可以选择：

第一种，要么把 getter/setter 方法都定义为 synchronized 方法，这样就可以套用管程锁定规则。
第二种，要么把 value 定义为 volatile 变量，由于 setter 方法对 value 的修改不依赖 value 的原值，满足 volatile 关键字使用场景，这样就可以套用 volatile 变量规则来实现先行发生关系。

通过上面这个案例，我们知道：一个操作时间上线发生，不代表这个操作会「先行发生」。 那如果一个操作「先行发生」，是否就能推导出这个操作必定是时间上先发生呢？其实并不能，因为有可能发生指令重排序。

// 如下操作在同一个线程中执行
int j = 1;
int j = 2;

上述代码在同一线程中执行，根据程序执行次序规则，int i = 1; 的操作先行发生于 int j = 2;，但 int j =2 的代码有可能被处理器先执行，因为它们不相互依赖，不影响先行发生原则的正确性。

上述这两个案例综合起来证明了一个结论：时间先后顺序与先行发生原则之间基本没有太大的关系，所以我们衡量并发安全问题的时候不要受到时间顺序的干扰，一切必须以先行发生原则为准。

总结

happens-before 原则一共有 8 条原则，它是对 Java 内存模型规则的简化，可以帮助编程人员提高编程效率。

时间先后顺序与先行发生原则之间基本没有太大的关系，我们衡量并发安全问题的时候不要受到时间顺序的干扰，一切必须以先行发生原则为准。

深入理解 happens-before 原则

推荐阅读

清华女神，34岁的美女博士县长，辞职了

薄公子低调成台湾女婿 23日已在台举办婚礼

警察殴打打人学生，舆论撕裂的背后

你手放哪呢，出生啊

故宫蛇年限定款藏书票，错过再等12年！

深入理解 happens-before 原则

什么是 happens-before？

极简实践案例

总结

您可能也对以下帖子感兴趣

清华女神，34岁的美女博士县长，辞职了

薄公子低调成台湾女婿 23日已在台举办婚礼

警察殴打打人学生，舆论撕裂的背后

你手放哪呢，出生啊​

故宫蛇年限定款藏书票，错过再等12年！

生成图片，分享到微信朋友圈

深入理解 happens-before 原则

什么是 happens-before？

极简实践案例

总结

您可能也对以下帖子感兴趣

你手放哪呢，出生啊